ES杂项

技术加油站大约 1 分钟

倒排索引

  1. 倒排索引和mysql里面的fulltext索引,目前还不知道是不是一个原理

先看张图:单词-文档矩阵

一列一列看,就是正排索引 一行一行看,就是倒排索引

正排索引告诉你的是:这个文档中有哪些关键字,每个关键字出现了多少次,出现在哪些位置 倒排索引告诉你的是:这个关键词在哪些文档中出现了,出现了多少次,出现在哪些位置

如果有人问你什么事倒排索引,就画这个图给他看

为什么搜索引擎都是倒排索引?

通过上图可以知道,告诉我关键字,可以非常快速的知道这个关键字出现在了哪些文档,而通过正排索引就需要遍历文档才知道

前端时间看到美团技术公众号发得一篇文章提到,他们已经尝试用ClickHorse+filebeat替换ELK了

ES性能测试

写入性能测试

  1. 单条数据越大,性能越差
  2. 集群环境下0副本的情况比1副本的情况吞吐量大概多1w docs/s
  3. 增加client数量能提高吞吐量,但超过2个后对吞吐量提高不是很明显,所以不建议超过2到3个为宜
  4. 单节点环境下有无副本貌似影响不大









  • 随机毒鸡汤:别总想着跟对象讲道理,因为这样很容易发现,自己没有对象。